La carte GHSOM comme alternative à la SOM pour l'analyse exploratoire de données
نویسندگان
چکیده
Résumé. L’objecif de cet article est de faire de la carte auto-organisatrice hiérarchique (GHSOM) un outil utilisable dans le cadre d’une démarche d’analyse exploratoire de données. La visualisation globale est un outil indispensable pour rendre les résultats d’une segmentation intelligibles pour un utilisateur. Nous proposons donc différents outils de visualisation pour la GHSOM équivalents à ceux de la SOM.
منابع مشابه
Classification topologique probabiliste pour des données catégorielles
Cet article présente une carte auto-organisatrice probabiliste pour l’analyse et la classification topologique des données catégorielles. En considérant un modèle de mélanges parcimonieux nous introduisons une nouvelle carte auto-organisatrice (SOM) probabiliste. L’estimation des paramètres de notre modèle est réalisée à l’aide de l’algorithme EM classique. Contrairement à SOM, l’algorithme d’a...
متن کاملCarte auto-organisatrice probabiliste sur données binaires
Résumé. Les méthodes factorielles d’analyse exploratoire statistique définissent des directions orthogonales informatives à partir d’un ensemble de données. Elles conduisent par exemple à expliquer les proximités entre individus à l’aide d’un groupe de variables caractéristiques. Dans le contexte du datamining lorsque les tableaux de données sont de grande taille, une méthode de cartographie sy...
متن کاملApprendre les contraintes topologiques dans les cartes auto-organisatrices
Résumé. La Carte Auto-Organisatrice (SOM : Self-Organizing Map) est une méthode populaire pour l’analyse de la structure d’un ensemble de données. Cependant, certaines contraintes topologiques de la SOM sont fixées avant l’apprentissage et peuvent ne pas être pertinentes pour la représentation de la structure des données. Dans cet article nous nous proposons d’améliorer les performances des SOM...
متن کاملApproches de type n-grammes pour l'analyse de parcours de vie familiaux
Résumé. Cet article1 porte sur l’analyse de parcours de vie représentés sous forme de séquences d’événements. Plus spécifiquement, on examine les possibilités d’exploiter des codages de type n-grammes de ces séquences pour en extraire des connaissances. En fait, compte tenu de la simultanéité de certains événements, une procédure stricte de n-grammes comme on peut par exemple l’appliquer sur de...
متن کاملARQAT : plateforme exploratoire pour la qualité des règles d'association
Résumé. Le choix de mesures d’intérêt pour la validation des règles d’association constitue un défi important dans le contexte de l’évaluation de la qualité en fouille de données. Mais, comme l’intérêt dépend à la fois de la structure des données et des buts de l’utilisateur (décideur, analyste), certaines mesures peuvent s’avérer pertinentes dans un contexte donné, et ne plus l’être dans un au...
متن کامل